#import "@preview/touying:0.6.1": *
#import themes.aqua: *
#import "@preview/pinit:0.2.2": *

#show: aqua-theme.with(
  aspect-ratio: "16-9",
  config-info(
    title: [概率论],
    subtitle: [Subtitle],
    author: [数学主义],
    date: datetime.today(),
    institution: [Institution],
  ),
)
#set text(font: ("Calibri", "Microsoft YaHei"), weight: "regular", size: 25pt)

#title-slide()

#outline-slide()

= 回顾
== 数学期望
<数学期望>
设离散随机变量$X : Omega arrow.r bb(R)$的分布列为
$ p \( x_i \) = P \( X = x_i \) \, quad i = 1 \, 2 \, dots.h.c \, n \, dots.h.c . $
如果(这就是说无穷级数绝对收敛)
$ sum_(i = 1)^oo \| x_i \| dot.op p \( x_i \) < oo \, $ 就说
$ E \( X \) colon.eq sum_(i = 1)^oo x_i dot.op p \( x_i \) $
是随机变量$X$的#strong[数学期望] (expectation)或#strong[平均值] (mean).

---

设连续随机变量$X : Omega arrow.r bb(R)$的密度函数为$p \( x \)$. 如果
$ integral_(- oo)^oo \| x \| dot.op p \( x \) d x < oo \, $ 就说
$ E \( X \) colon.eq integral_(- oo)^oo x dot.op p \( x \) d x $
是随机变量$X$的#strong[数学期望]或#strong[平均值].

== 方差
<方差>

设$X : Omega arrow.r bb(R)$是随机变量.
如果随机变量$X^2$的数学期望$E \( X^2 \)$存在,
我们就说随机变量$\( X - E \( X \) \)^2$的数学期望$E \[ \( X - E \( X \) \)^2 \]$是随机变量$X$
(或$X$所服从的分布) 的#strong[方差] (variance), 记为
$ upright(V a r) \( X \) colon.eq E \( X - E \( X \) \)^2 = E \( X^2 \) - \[ E \( X \) \]^2 . $
平方根$sqrt(upright(V a r) \( X \))$ (取正值) 叫做随机变量$X$
(或$X$所服从的分布) 的#strong[标准差] (standard deviation), 记为
$sigma \( X \)$ 或 $sigma_X$.

== 正态分布
<正态分布>
#strong[正态分布]（Normal
Distribution）又称高斯分布，是最重要的连续型概率分布。

随机变量 $X$ 服从正态分布记为 $X tilde.op N \( mu \, sigma^2 \)$，其中：

- 位置参数 $mu$（均值/期望）：正态分布的中心位置，决定分布的左右偏移（$- oo < mu < + oo$）；

- 尺度参数 $sigma^2$（方差）： 越小则越集中，越大则越分散。

注：当 $mu = 0$ 且 $sigma^2 = 1$ 时，称为#strong[标准正态分布]，记为
$X tilde.op N \( 0 \, 1 \)$.

---

对于 $X tilde.op N \( mu \, sigma^2 \)$，其概率密度函数为
$ p \( x \) = frac(1, sqrt(2 pi) sigma) e^(- frac(\( x - mu \)^2, 2 sigma^2)) \, quad - oo < x < + oo $
其中：

- $e$ 为自然常数（约2.71828）；

- $pi$ 为圆周率（约3.14159）；

- 函数图像即"钟形曲线"，形状由 $mu$ 和 $sigma$ 共同决定。

---

对于 $X tilde.op N \( mu \, sigma^2 \)$，其分布函数为
$ F \( x \) = integral_(- oo)^x frac(1, sqrt(2 pi) sigma) e^(- frac(\( t - mu \)^2, 2 sigma^2)) d t $

---

#strong[课堂练习]

设 $X tilde.op N \( mu \, 4^2 \)$，$Y tilde.op N \( mu \, 5^2 \)$，记
$p_1 = P { X lt.eq mu - 4 }$，$p_2 = P { Y gt.eq mu + 5 }$，则

+ 对任意的 $mu$，都有 $p_1 = p_2$

+ 对任意的 $mu$，都有 $p_1 < p_2$

+ 只对个别 $mu$，才有 $p_1 = p_2$

+ 对任意的 $mu$，都有 $p_1 > p_2$

---

- 令 $Z = frac(X - mu, sigma)$，则 $Z tilde.op N \( 0 \, 1 \)$；

- $P \( X lt.eq x \) = Phi (frac(x - mu, sigma))$，其中 $Phi \( z \)$ 为标准正态分布的分布函数。

---

3σ原则常用于判断随机变量是否近似服从正态分布：

- $P \( mu - sigma lt.eq X lt.eq mu + sigma \) approx 68.27 %$（约2/3数据集中在均值±1个标准差内）；

- $P \( mu - 2 sigma lt.eq X lt.eq mu + 2 sigma \) approx 95.45 %$（约95%数据集中在均值±2个标准差内）；

- $P \( mu - 3 sigma lt.eq X lt.eq mu + 3 sigma \) approx 99.73 %$（几乎所有数据集中在均值±3个标准差内）。

---

正态分布的期望与方差直接对应其分布参数，无需额外计算：
$ E \( X \) = mu $ $ upright("Var") \( X \) = sigma^2 $

---

= 正态分布的标准化

---
*定理* 若随机变量 $X tilde.op N \( mu \, sigma^2 \)$，则
$U = frac(X - mu, sigma) tilde.op N \( 0 \, 1 \)$。


这是是#strong[连续随机变量函数的分布]定理的特例。

---

由分布函数的定义，$U$ 的分布函数为：
$ F_U \( u \) = P \( U lt.eq u \) = P (frac(X - mu, sigma) lt.eq u) $
对不等式变形（因 $sigma > 0$，不等号方向不变）：
$ F_U \( u \) = P \( X lt.eq mu + sigma u \) $ 而
$P \( X lt.eq mu + sigma u \)$ 是 $X$ 的分布函数在 $x = mu + sigma u$
处的取值，即： $ F_U \( u \) = F_X \( mu + sigma u \) $

---

根据"概率密度是分布函数的导数"，对 $F_U \( u \)$ 关于 $u$
求导，结合#strong[复合函数求导法则]：
$ p_U \( u \) = frac(d, d u) F_U \( u \) = frac(d, d u) F_X \( mu + sigma u \) = p_X \( mu + sigma u \) dot.op sigma $
其中 $p_X \( x \)$ 是 $X$ 的概率密度函数，即：
$ p_X \( x \) = frac(1, sqrt(2 pi) sigma) e^(- frac(\( x - mu \)^2, 2 sigma^2)) $

---

将 $x = mu + sigma u$ 代入 $p_X \( x \)$：
$ p_X \( mu + sigma u \) = frac(1, sqrt(2 pi) sigma) e^(- frac(\( mu + sigma u - mu \)^2, 2 sigma^2)) = frac(1, sqrt(2 pi) sigma) e^(- u^2 / 2) $
再代入 $p_U \( u \)$ 的表达式：
$ p_U \( u \) = p_X \( mu + sigma u \) dot.op sigma = (frac(1, sqrt(2 pi) sigma) e^(- u^2 / 2)) dot.op sigma = 1 / sqrt(2 pi) e^(- u^2 / 2) $

---

标准正态分布 $N \( 0 \, 1 \)$ 的概率密度函数为
$1 / sqrt(2 pi) e^(- u^2 / 2)$，因此：
$ U = frac(X - mu, sigma) tilde.op N \( 0 \, 1 \) $

---

在此定理中，$g \( x \) = frac(x - mu, sigma)$
是#strong[严格单调递增且可导]的函数（导数为
$1 / sigma$）。

---

= 连续随机变量函数的分布
---

#strong[条件：]

+ $X$ 是连续随机变量，密度函数为 $p_X \( x \)$；

+ $Y = g \( X \)$ 是连续随机变量，且 $y = g \( x \)$
  是#strong[严格单调函数]（严格递增或严格递减）；

+ $g \( x \)$ 的反函数 $h \( y \)$（即
  $x = h \( y \)$）有#strong[连续导函数]。

---

#strong[结论：] $Y = g \( X \)$ 的密度函数为：
$ p_Y \( y \) = cases(delim: "{", p_X [h \( y \)] dot.op lr(|h' \( y \)|) \, & a < y < b \,, 0 \, & upright("其他") .) $
其中：

- $h \( y \)$ 是 $g \( x \)$ 的反函数（由 $y = g \( x \)$ 解出
  $x = h \( y \)$）；
- $lr(|h' \( y \)|)$ 是反函数导数的#strong[绝对值]；
- $a = min {g \( - oo \) \, g \( oo \)}$，$b = max {g \( - oo \) \, g \( oo \)}$（即 $Y$ 的取值区间）。

---

证明思路：先求分布函数 $F_Y \( y \)$，再对其求导得密度函数
$p_Y \( y \)$

---

分区间讨论分布函数 $F_Y \( y \) = P \( Y lt.eq y \)$

- 当 $y < a$ 时：$g \( x \)$ 的取值下限为 $a$，故 $Y lt.eq y$
  是不可能事件，$F_Y \( y \) = 0$；

- 当 $y > b$ 时：$g \( x \)$ 的取值上限为 $b$，故 $Y lt.eq y$
  是必然事件，$F_Y \( y \) = 1$；
---
- 当 $a lt.eq y lt.eq b$ 时：因 $g \( x \)$
  严格递增，$g \( X \) lt.eq y$ 等价于 $X lt.eq h \( y \)$（$h \( y \)$
  是 $g \( x \)$ 的反函数），因此：
  $ F_Y \( y \) = P \( X lt.eq h \( y \) \) = integral_(- oo)^(h \( y \)) p_X \( x \) thin d x $

---

根据"密度函数是分布函数的导数"，结合#strong[变上限积分求导法则]和#strong[复合函数求导法则]，对
$F_Y \( y \)$ 关于 $y$ 求导：
$ p_Y \( y \) = frac(d, d y) F_Y \( y \) = p_X [h \( y \)] dot.op h' \( y \) $
此处 $h' \( y \) > 0$（因为 $g \( x \)$ 严格递增，所以反函数 $h \( y \)$
也严格递增，导数为正）。

---

#strong[推广到严格单调递减的情况]

若 $g \( x \)$ 严格递减，则反函数 $h \( y \)$ 也严格递减，此时
$h' \( y \) < 0$。为保证密度函数非负，需添加#strong[绝对值符号]：
$ p_Y \( y \) = p_X [h \( y \)] dot.op lr(|h' \( y \)|) $

---

无论 $g \( x \)$ 严格递增还是递减，$Y = g \( X \)$
的密度函数可统一表示为：
$ p_Y \( y \) = cases(delim: "{", p_X [h \( y \)] dot.op lr(|h' \( y \)|) \, & a < y < b \,, 0 \, & upright("其他") .) $
定理得证。

---

正态分布标准化定理 $U = frac(X - mu, sigma) tilde.op N \( 0 \, 1 \)$
是该定理的特例：

- 原变量 $X tilde.op N \( mu \, sigma^2 \)$，密度函数
  $p_X \( x \) = frac(1, sqrt(2 pi) sigma) e^(- frac(\( x - mu \)^2, 2 sigma^2))$；
- 函数 $g \( x \) = frac(x - mu, sigma)$ 严格单调递增，反函数是
  $h \( y \) = mu + sigma y$，导数是 $h' \( y \) = sigma$，故
  $|h' \( y \)| = sigma$；
- 代入定理公式，得 $U$ 的密度函数：
  $ p_U \( y \) = p_X \( mu + sigma y \) dot.op sigma = frac(1, sqrt(2 pi) sigma) e^(- y^2 / 2) dot.op sigma = 1 / sqrt(2 pi) e^(- y^2 / 2) $
  这正是标准正态分布 $N \( 0 \, 1 \)$ 的密度函数，故
  $U tilde.op N \( 0 \, 1 \)$。

---

*定理*

设随机变量$X$服从正态分布$N \( mu \, sigma^2 \)$，那么当$a eq.not 0$时有
$ Y = a X + b tilde.op N \( a mu + b \, a^2 sigma^2 \) . $

因此，服从正态分布的随机变量的线性变换仍然服从正态分布。


---

#strong[例题：]设随机变量 $X tilde.op N \( 10 \, 2^2 \)$，试求
$Y = 3 X + 5$ 的分布。

根据刚才的定理： 若
$X tilde.op N \( mu \, sigma^2 \)$，则当 $a eq.not 0$ 时
$Y = a X + b$ 仍服从正态分布，即
$Y tilde.op N \( a mu + b \, a^2 sigma^2 \)$，所以
$ Y = 3 X + 5 tilde.op N \( 3 times 10 + 5 \, 5^2 times 2^2 \) = N \( 35, 6^2 \) $

---

#strong[例题：]设随机变量 $X tilde.op N \( 10 \, 2^2 \)$，试求
$Y = 3 X + 5$ 的分布。

根据刚才的定理： 若
$X tilde.op N \( mu \, sigma^2 \)$，则当 $a eq.not 0$ 时
$Y = a X + b$ 仍服从正态分布。因此，只需计算 $Y$
的#strong[数学期望]和#strong[方差]，即可确定其正态分布参数。

== 步骤2：计算 $Y$ 的数学期望 $E \( Y \)$
<步骤2计算-y-的数学期望-ey>
需计算 $E \( 3 X + 5 \)$，这里用到#strong[数学期望的线性性质]：
对任意随机变量 $X$ 和常数 $a \, b$，有
$ E \( a X + b \) = a E \( X \) + b $

已知 $X tilde.op N \( 10 \, 2^2 \)$，故
$E \( X \) = 10$（正态分布的数学期望为第一个参数 $mu$）。代入得：
$ E \( Y \) = E \( 3 X + 5 \) = 3 dot.op E \( X \) + 5 = 3 times 10 + 5 = 35 $

== 步骤3：计算 $Y$ 的方差 $upright("Var") \( Y \)$
<步骤3计算-y-的方差-textvary>
需计算 $upright("Var") \( 3 X + 5 \)$，这里用到#strong[方差的线性性质]：
对任意随机变量 $X$ 和常数 $a \, b$，有
$ upright("Var") \( a X + b \) = a^2 dot.op upright("Var") \( X \) $
（常数的方差为0，故 $b$ 不影响方差）

已知 $X tilde.op N \( 10 \, 2^2 \)$，故
$upright("Var") \( X \) = 2^2 = 4$（正态分布的方差为第二个参数
$sigma^2$）。代入得：
$ upright("Var") \( Y \) = upright("Var") \( 3 X + 5 \) = 3^2 dot.op upright("Var") \( X \) = 9 times 4 = 36 $

== 步骤4：确定 $Y$ 的分布
<步骤4确定-y-的分布>
因为 $Y$ 服从正态分布，且期望为 $35$、方差为 $36$（标准差
$sigma = sqrt(36) = 6$），所以： $ Y tilde.op N \( 35 \, 6^2 \) $

---

#strong[课堂练习]

设 $E \( X \) = mu$，$upright("Var") \( X \) = sigma^2$，则对任意常数
$C$，必有：

+ $E \[ \( X - C \)^2 \] = E \( X^2 \) - C^2$

+ $E \[ \( X - C \)^2 \] = E \[ \( X - mu \)^2 \]$

+ $E \[ \( X - C \)^2 \] < E \[ \( X - mu \)^2 \]$

+ $E \[ \( X - C \)^2 \] gt.eq E \[ \( X - mu \)^2 \]$

